检索结果

Select

1. 一种新闻网页关键信息的提取算法

向菁菁, 耿光刚, 李晓东

计算机应用 2016, 36 (8): 2082-2086. DOI: 10.11772/j.issn.1001-9081.2016.08.2082

摘要（633）

PDF （888KB）（597）

针对网页正文提取算法缺乏通用性，以及对新闻网页的提取缺乏标题、时间、来源信息的问题，提出一种新闻关键信息的提取算法newsExtractor。该算法首先通过预处理将网页转换成行号和文本的集合，然后根据字数最长的一句话出现在新闻正文的概率极高的特点，从正文中间开始向两端寻找正文的起点和终点提取新闻正文，根据最长公共子串算法提取标题，构造正则表达式并以行号辅助判断提取时间，根据来源的格式特点并辅以行号提取来源；最后构造了数据集与国外开源软件newsPaper进行提取准确率的对比实验。实验结果表明，newsExtractor在正文、标题、时间、来源的平均提取准确率上均优于newsPaper，具有通用性和鲁棒性。

参考文献 | 相关文章 | 多维度评价

Select

2. 基于特征层融合的人脸识别新方法

刘敏李晓东王振海

计算机应用 2009, 29 (10): 2662-2664.

摘要（1128）

PDF （619KB）（1138）

为了探索人脸识别中有效的特征提取方法，提出了一种基于特征层融合的算法。该方法融合了保局投影(LPP)和最大间距准则(MMC)两种方法。首先对训练样本进行LPP判别分析，得到每个训练样本在LPP子空间上的投影，然后利用MMC方法对所有的投影进行鉴别分析，提取出更有效的样本判别特征；采用最小近邻分类器分类。在ORL人脸库的测试结果表明，在姿态、光照、表情、训练样本数目变化的情况下，该算法都具有较好的识别率。

相关文章 | 多维度评价

Select

3. 一种新的有监督保局投影人脸识别算法

刘敏李晓东王振海

计算机应用 2009, 29 (05): 1416-1422.

摘要（1264）

PDF （586KB）（1430）

为了充分利用样本的类别信息，提出了一种新的有监督保局投影人脸识别算法（NSLPP）。首先，把类间散布矩阵融入到传统保局投影算法的目标函数中，修改目标函数，并基于新的目标函数得到变换矩阵；然后用线性鉴别的思想筛选出变换矩阵中的最优基向量，构成最终的变换矩阵，把训练样本和测试样本投影到有最优基向量构成的子空间得到训练样本和测试样本的特征；最后采用最近邻分类器分类，在ORL和FERET人脸库上的测试结果表明，NSLPP算法具有较好的识别性能。